糖尿病是一种普遍存在的慢性疾病,全世界具有重大的健康和经济负担。早期的预测和诊断可以帮助有效地管理和预防并发症。本研究探讨了使用机器学习模型根据生活方式因素进行基于生活方式因素预测糖尿病的使用,该数据使用行为风险面对面监视系统(BRFSS)2015调查的数据。数据集由21种生活方式和与健康相关的特征组成,包括体育锻炼,饮食,心理健康和社会经济状况等方面。实施并评估了三种分类模型 - 决策树,K-Nearest邻居(KNN)和逻辑回归 - 以确定其预测性能。使用平衡的数据集对模型进行了训练和测试,并根据准确性,精度,召回和F1得分对其性能进行评估。结果表明,决策树,KNN和逻辑回归的精度分别为74%,72%和75%,在精确和召回方面具有不同的优势。这些发现突出了糖尿病预测中机器学习的潜力,并通过特征选择和合奏学习技术提出了改进。
主要关键词
![arxiv:2503.04137V1 [CS.LG] 2025年3月6日 div>PDF文件第1页](/bimg/d/da479c80f950b59bb832b223b522badfda901213.webp)
![arxiv:2503.04137V1 [CS.LG] 2025年3月6日 div>PDF文件第2页](/bimg/a/aab97e3b994e01cb6017a28e92d2a71f706d9be3.webp)
![arxiv:2503.04137V1 [CS.LG] 2025年3月6日 div>PDF文件第3页](/bimg/c/cd70c2e214e01e17d048e972964f1088b5775401.webp)
![arxiv:2503.04137V1 [CS.LG] 2025年3月6日 div>PDF文件第4页](/bimg/7/7dfce5d9b90b43431cdb4888efee21315a5e5617.webp)
![arxiv:2503.04137V1 [CS.LG] 2025年3月6日 div>PDF文件第5页](/bimg/9/9eb2129d89717b2566b54b9fb3339a9b99f237ad.webp)
